Untuk meningkatkan kinerja sistem pengenalan fonem otomatis pada saat dioperasikan pada lingkungan berderau, kami mengembangkan teknik baru yang dapat melakukan estimasi terhadap suatu fitur fonem bersih dari bentuk berderaunya. Fitur-fitur kokoh tersebut diperoleh dari koefisien transformasi paket wavelet kompleks (ComplexWavelet Packet Transform/CWPT). Karena koefisien CWPT merepresentasikan semua pita frekuensi yang berbeda dari suatu sinyal masukan, mendekomposisi sinyal masukan tersebut ke dalam pohon CWPT yang lengkap akan mencakup semua frekuensi yang terlibat dalam proses pengenalan. Setiap komponen frekuensi dalam sinyal masukan akan ditempatkan pada tepat satu pita frekuensi yang spesifik. Untuk suatu campuran sinyal domain waktu dengan frekuensi yang berbedabeda, misalnya sinyal fonem dengan derau, semua koefisien fonem dalam pita frekuensi yang sama, yaitu semua koefisienyang melewati jalur filter bank wavelet yang sama, akan berubah sesuai dengan magnituda komponen frekuensi derau. Oleh karena itu, jika ada sebuah pita frekuensi yang tidak mengandung derau sama sekali, seluruh koefisien fonem pada pita frekuensi tersebut tidak akan mengalami perubahan. Informasi dari semua koefisien yang dikandung oleh pita frekuensi tersebut kemudian dapat dimanfaatkan untuk melakukan estimasi terhadap kemungkinan fonem bersihnya. Karena jumlah fonem dalam suatu bahasa adalah terbatas dan relatif kecil dan sudah diketahui dengan baik sebelumnya, teknik yang dikembangkan ini fisibel secara komputasi. Hasil-hasil simulasi menunjukkan bahwa teknik baru yang dikembangkan ini merupakan pengekstrak fitur yang efisien dan tidak hanya dapat meningkatkan kekokohan sistem pengenal fonem otomatis jika dioperasikan pada berbagai macam lingkungan yang berderau tetapi juga tetap memelihara kinerja baiknya pada lingkungan yang bersih.To improve the performance of Automatic Phoneme Recognition in noisy environment, we developed a new technique that could estimate clean phoneme feature from its noisy one. These robust features are obtained from Complex Wavelet Packet Transform (CWPT) coefficients. Since the CWPT coefficients represent all different frequency bands of the input signal, decomposing the input signal into complete CWPT tree would covered all frequencies that involved in recognitionprocess. Each frequency would be placed into exactly one of its frequency bands. For time overlapping signals with different frequency contents, e. g. phoneme with noises, all coefficientsbelongs to the same frequency band, which is coming through the same wavelet filter banks path, would be changed according to noise frequencies magnitude. Thus, if there is one frequency band which contain no noises at all, all coefficients belongs to that frequency band would not change. Information from all coefficients belongs to that frequency band could be used then to estimate the clean phonemes. Since the numbers of phonemes are limited and already well known, this technique is computationally feasible. Simulation results showed that this new technique is an efficient features extractor that improves the robustness of the systems in various adverse noisy conditions but still reserve the good performance in clean environments.